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摘要 : 【 目的 ] 为 实现 科技 知识 组 织 体系 (STKOS) 的 共享 和 利用 。【 应 用 背景 ] 构建 知识 组 织 体系 有 机 存储 与 访 


问 的 引擎 系统 是 实现 知识 组 织 体系 有 效 利 用 的 前 提 条 件 。[ 方法 ] 构建 支持 STKOS 各 类 元 素 检索 、 浏 览 、 


关联 、 


导航 的 语义 存储 与 索引 体系 、 语 义 查询 与 推理 内 核 以 及 STKOS APL 并 对 外 提供 开放 查询 与 推理 接口 。[ 结果 】 
该 引擎 系统 支持 STKOS 发 布 服务 平台 建设 以 及 STKOS 在 第 三 方 检索 服务 系统 的 应 用 。[ 结论 ] 通过 STKOS 开 
放 引 擎 系统 ,科技 文献 信息 机 构 和 研究 人 员 能 够 方便 有 效 地 利用 STKOS。 


关键 词 : 知识 组 织 引擎 系统 ”查询 接口 


分 类 号 : TP393 


1 3 引 


目前 , 叙 词 表 、 主 题词 表 、 分 类 表 、 术 语 表 、 本 
体 等 知识 组 织 体系 在 信息 资源 组 织 、 揭 示 、 检 索 、 发 
现 等 方面 发 挥 着 巨大 的 作用 。 由 国家 科技 文献 信息 中 
心 牵头 ,组 织 实施 了 国家 科技 支撑 计划 项 目 “ 面 向 外 
文科 技 文献 信息 的 知识 组 织 体系 建设 和 示范 应 用 ” 
通过 构建 我 国 面向 外 文科 技 文献 的 知识 组 织 体系 
(Scientific & Technological Knowledge Organization 
Systems, STKOS), 为 我 国 海量 外 文科 技 文献 信息 的 组 
织 和 利用 提供 支撑 门 。 作 为 该 项 目的 重要 组 成 部 分 ， 
“科技 知识 组 织 体系 共享 服务 平台 建设 ”课题 的 建设 目 
标 是 构建 支持 我 国 科技 界 、 科 技 信息 服务 机 构 和 信息 
处 理 领 域 实现 STKOS 有 效 利用 的 开放 式 服务 环境 。 
而 实现 STKOS 开放 共享 的 前 提 是 构建 STKOS 有 机 存 
储 与 访问 的 开放 引擎 系统 。 

为 此 , 本文 在 充分 调研 国内 外 相关 研究 和 系统 建 
设 经 验 的 基础 上 , 提出 STKOS 开放 引 警 系统 的 总 体 


了 


二 


框架 ,进行 各 功能 的 设计 与 实现 ,并 介绍 引擎 系统 的 
应 用 情况 。STKOS 开放 引擎 系统 采用 先进 的 语义 仓 
储 、 索 引 、 查 询 、 推 理 、 接 口技 术 , 构建 STKOS 的 存 
储 索 引 体系 、 语 义 查 询 与 推理 内 核 以 及 支持 STKOS 
各 类 元 素 检索 、 浏 览 、 关 联 、 导 航 的 STKOS API, 3 
通过 上 层 封装 开发 基于 标准 协议 的 开放 接口 , 供 国内 
各 机 构 和 第 三 方 系统 使 用 ,让 STKOS 在 我 国 科 技 界 、 
科技 信息 服务 机 构 和 信息 处 理 领域 的 科技 创新 中 充分 
发 挥 作用 。 


2 国内 外 相关 研究 


为 实现 知识 组 织 体系 的 有 效 利 用 ,国内 外 许多 机 
构 已 经 开展 了 知识 组 织 体系 发 布 与 共享 服务 的 相关 研 
究 和 系统 建设 , 通过 在 线 检索 与 浏览 服务 、API 接口 、 
Web 服务 等 方式 支持 用 户 以 及 机 器 对 知识 组 织 体系 的 
访问 和 调用 。 

UMLS 术语 服务 提供 在 线 的 检索 和 浏览 界面 以 及 
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远程 访问 的 Web 服务 APL 并 且 在 每 个 UMLS 完整 下 
载 版 本 中 都 包含 了 本 地 安装 和 定制 超级 词 表 的 
MetamorphoSys 工具 。UMLS 超级 词 表 的 数据 采用 
RRF 文件 或 ORF 文件 存储 , 这 两 类 文件 都 遵循 实体 关 
系 (ER) 模 型 ， 通 过 一 系列 类 似 ER 模型 的 “查询 图 ” 实 
现 多 个 文件 的 联合 查询 中。MetamorphoSys 工具 通过 
构建 索引 文件 提高 其 RRF 浏览 器 的 检索 效率 四。 此 外 ， 
MetamorphoSys 工具 可 以 创建 SQL 脚本 将 定制 的 
UMLS 超级 词 表 和 语义 网 络 加 载 到 Oracle、MySQL 等 
关系 数据 库 中 , 方便 用 户 进 一 步 利 用 UMLSD 1。 

NCI 企业 级 词 表 服 务 (EVS) 通 过 开源 的 LexEVS 
术语 服务 器 提供 NCI 叙 词 表 、NCI 超级 词 表 以 及 NCI 
与 其 他 术语 表 的 集成 检索 与 浏览 服务 外 ,LexEVS 底层 
基于 LexGrid 模型 实现 如 OBO 格式 、NCI 叙 词 表 的 
OWL 语言 、UMLS 的 RRF 格式 等 多 种 词 表 格式 的 形 
式 化 表示 与 存储 , 利用 Java API 和 分 布 式 LexBIG APTI 
实现 LexGrid 模型 词 表 数据 的 查询 与 访问 , 并 创建 
Lucene 索引 增强 词 表 数 据 查 询 性 能 ， 此 外 提供 SOAP 
和 REST 两 种 方式 的 服务 接口 口 。 

OCLC 术语 服务 提供 FAST、GSAFD、LCSH、 
MeSH 等 词 表 的 检索 与 浏览 服务 , 支持 HTML、MARC 
XML SKOS 和 Zthes 等 多 种 数据 格式 , 以 及 SRU CQL 
语法 的 检索 功能 , 通过 Web 服务 接口 向 第 三 方 提供 
XML、RDF 以 及 JSON 编码 的 输出 , 支持 REST 和 
SRU/SRW 两 类 访问 方式 四。 

AIMS 网 站 提供 AGROVOC 多 语种 农业 主题 词 表 
的 在 线 搜索 、 浏 览 和 下 载 服 务 , AGROVOC Web 服务 
采用 SOAP 技术 允许 访问 RDF 版 本 的 AGROVOC 数 
据 。 AIMS 开发 的 VocBench 编辑 工具 实现 了 基于 万 维 
网 的 AGROVOC 开源 协作 式 编 辑 , 以 此 编辑 和 维护 的 
AGROVOC 采用 SKOS-XL 概念 框架 , 已 作为 一 个 关 
联 开放 数据 (LOD) 发 布 , 与 农业 方面 的 其 他 多 语种 知 
识 组 织 系统 相关 联 ， 其 关联 数据 版 本 采用 AllegroGraph 
数据 库存 储 ， 提供 机 器 可 访问 的 SPARQL 终端 , 通过 
Pubby 工具 生成 人 类 可 读 的 HTML 页 面 "1。 
国内 方面 , 中国 科学 技术 信息 研究 所 建设 汉语 科 
技 词 系统 , 通过 vocgrid 网 络 平台 "对 外 提供 服务 , 用 
户 可 以 通过 该 平台 访问 获取 词 条 的 全 部 知识 四 。 汉 语 


Dhttp://www.vocgrid.org. 


区 现代 图 书 情报 技术 


科技 词 系统 使 用 MySQL 数据 库存 储 词 系 统 , API 接口 
分 为 数据 层 (DataAccess) 和 逮 辑 层 (BusinessLogic)， 采 
用 Web 服务 技术 将 系统 各 模块 的 应 用 服务 接口 进行 了 
封装 处 理 和 发 布 实现 呈 。 

欧 石 燕 5 在 对 国外 术语 注册 与 数据 服务 系统 深入 
调研 后 , 提出 我 国术 语 注册 与 术语 服务 系统 的 开发 与 
构建 的 建议 : 采用 新 兴 的 语义 网 和 关联 数据 技术 开发 
兼 具 术 语 注 册 与 术语 服务 功能 的 完整 系统 ,提供 人 与 
机 器 对 注册 词 表 元 数据 和 词 表 内 容 的 访问 , 采用 
RESTful Web 服务 构建 术语 服务 , 支持 以 关联 数据 方 
式 发 布 词 表 内 容 。 
通过 上 述 国内 外 相关 研究 可 以 发 现 : 目前 知识 组 
织 体系 逐渐 向 SKOS/RDF、OWL 等 数据 格式 转变 ,其 
存储 机 制 也 从 关系 型 数据 库存 储 向 RDF 语义 仓储 转 
换 ， 同 样 对 外 访问 方式 也 在 基于 SOAP 协议 的 Web 服 
务 方式 基础 上 增加 REST 方式 和 SPARQL 终端 访问 方 
式 。 为 此 , 针对 STKOS 实际 情况 , 本 项 目 采 用 先进 的 
语义 仓储 、 索 引 、 查 询 、 推 理 、 接 口技 术 开 发 了 STKOS 
开放 引擎 系统 。 


3 系统 设计 与 实现 


3.1 总 体 框架 

STKOS 开放 引擎 系统 是 以 科技 知识 组 织 体系 
(STKOS) 为 内 容 , 开发 实现 的 一 个 开放 式 知识 组 织 引 
擎 , 它 根 据 STKOS 数据 特性 构建 高 性 能 的 、 可 靠 的 知 
识 存储 索引 体系 和 STKOS 检索 查询 与 语义 推理 内 核 
引擎 ,支持 STKOS 发 布 服务 平台 建设 , 并 提供 可 供 外 
部 调用 的 STKOS API 接口, 通过 标准 的 开放 查询 和 推 
理 服 务 接口 协议 供 国 内 各 机 构 和 第 三 方 系统 使 用 。 
STKOS 开放 引擎 系统 的 总 体 框架 ， 如 图 1 所 示 , 共 分 
4 个 层次 : 存储 与 索引 层 、 查 询 与 推理 功能 层 、STKOS 
API 层 以 及 开放 查询 和 推理 接口 层 。 

(1) 存储 与 索引 层 : 采用 Virtuoso 作为 底层 RDF 
数据 库 , 存储 STKOS 超级 科技 词 表 和 本 体 的 所 有 
RDF 三 元 组 , 在 其 基础 上 构建 RDF 索引 和 Solr 多 维 索 
引 , 支持 基于 知识 存储 索引 系统 的 查询 、 推 理 及 应 用 
服务 。 

(2) 查询 与 推理 功能 层 : 在 存储 与 索引 层 的 基础 
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科技 知识 组 织 体系 (STKOS) 


图 1 STKOS 开放 引擎 系统 总 体 框架 


上 , 进一步 实现 对 SPARQL 查询 的 优化 ,同时 进行 相 
应 的 索引 调度 和 分 析 处 理 。 采 用 索引 前 推理 和 检索 中 
实时 推理 相 结合 的 方式 ,实现 针对 STKOS 的 语义 推 
理 功能 。 

(3) STKOS API 层 : 根据 STKOS 超级 词 表 元 数据 
和 本 体 结构 特点 设计 实现 STKOS API 接口 , 支持 上 层 
访问 与 应 用 。STKOS API 层 由 三 个 子 层 构成 : STKOS 
基本 API、STKOS 上 层 API 以 及 STKOS SorAPL 实现 
对 STKOS 数据 的 基本 访问 以 及 面向 应 用 的 API 接口 。 

(4) 开放 查询 和 推理 接口 层 : 通过 接口 管理 器 控 
制 STKOS 开放 查询 和 推理 接口 的 对 外 服务 , 基于 
Web 服 务 体系 架构 , 分 别 利 用 基于 SOAP 协 议和 REST 
协议 的 Web 服务 实现 STKOS 引擎 系统 的 功能 封装 ， 
并 提供 SPARQL 终端 支持 外 部 直接 输入 SPARQL 查询 
语句 对 RDF 进行 查询 。 
3.2 ”数据 存储 

科技 知识 组 织 体系 (STKOS) 由 规范 词 表 系 统 和 本 
体 库 组 成 , STKOS 超级 科技 词 表 中 预计 收录 科技 术语 
不 少 于 500 万 条 , 科技 概念 规范 名 称 80 万 条 ,领域 本 
体 概念 达到 6 万 条 ,属性 20 万 条 趾 。 为 支持 STKOS 
的 开放 与 关联 , 将 STKOS 超级 科技 词 表 与 本 体 都 以 
RDF 三 元 组 形式 进行 存储 和 利用 。 在 对 语义 仓储 
充分 调研 基础 上 ,选用 高 性 能 的 Virtuoso 数据 库 作 为 
RDF 仓储 , 实现 STKOS 超级 科技 词 表 和 领域 本 体 超 


大 规模 RDF 三 元 组 的 有 效 存储 ,支持 查询 、 推 理 及 应 
用 服务 。 

Virtuoso 是 一 个 通用 的 RDF 数据 库 ， 所 有 的 三 元 
组 连同 命名 图 信息 存放 在 四 元 组 表 RDF_QUAD 中 ， 
表 中 4 列 (GSPO) 分 别 表 示 Graph、Subject、Predicate 
和 Object。 为 存储 STKOS 的 超级 科技 词 表 和 领域 本 体 ， 
分 别 创建 命名 图 , 根据 STKOS 超级 科技 词 表 元 数据 
规范 定义 数据 转换 规则 , 编写 自动 转换 程序 通过 
Virtuoso 的 JDBC 连接 数据 库 将 超级 科技 词 表 转换 为 
RDF 三 元 组 后 直接 存 人 数据 库 中 , 并 利用 Virtuoso 自 
带 工具 直接 导入 领域 本 体 OWL 文件 。 
3.3 索引 设计 

为 支持 快速 检索 和 全 文 检索 功能 ,分别 面 向 底层 
存储 和 上 层 应 用 设计 Virtuoso 索引 和 Solr 索引 。 通 过 
深入 分 析 STKOS 超级 科技 词 表 和 领域 本 体 数据 特点 
发 现 其 RDF 三 元 组 Predicate 的 数量 相对 于 Subject 和 
Object 而 言 规模 最 小 ,从 查询 需求 上 考虑 ，RDF 仓储 
更 适合 选择 Predicate 作为 主 索引 项 , 为 此 采用 PSOG 
和 POGS 的 RDF 索引 模式 对 Virtuoso 数据 库 的 
RDF_QUAD 表 构 建 RDF 索引 。 

尽管 Virtuoso 数据 库 本 身 提供 全 文 检索 功能 , 但 
其 通用 性 比较 强 , 数据 规模 较 大 的 检索 性 能 并 不 理 
想 。 因 此 利用 Solr 在 全 文 和 分 面 检索 上 的 突出 性 能 和 
灵活 的 组 织 方 式 , 对 STKOS 超级 科技 词 表 和 领域 本 
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体 建 立 索 引 , 并 通过 HTTP 协议 提供 全 文 检索 服务 。 

针对 超级 词 表 的 主要 元 素 如 术语 、 概 念 、 范 畴 类 等 分 
别 依 据 元 数据 描述 信息 以 及 需要 进行 全 文 检索 的 数据 
确定 索引 字段 , 而 领域 本 体 中 分 别 对 类 、 实 例 的 RDF 
三 元 组 集合 建立 索引 ,以 此 支持 对 于 STKOS 基本 元 
素 的 索引 构建 , 满足 全 文 检索 快速 响应 的 需求 。 

3.4 查询 优化 与 推理 策略 

在 STKOS 底层 仓储 和 索引 构建 的 基础 上 , 进 一 
步 优 化 查询 性 能 , 制定 推理 策略 ,支撑 面向 STKOS 的 
查询 和 推理 功能 。 查 询 优化 主要 从 查询 性 能 优化 和 查 
询 处 理 过 程 优化 展开 。 对 Virtuoso 的 SPARQL 查询 执 
行 效率 进行 优化 , 利用 Virtuoso 数据 库 本 身 的 缓存 机 
制 等 优化 策略 ， 并 优化 NumberOfBuffers 、MaxDirty 
Buffers 等 数据 库 配 置 参数 , 提高 STKOS 物理 存储 的 
查询 性 能 。 此 外 , 针对 STKOS 超级 科技 词 表 和 领域 本 
体 中 基本 元 素 制 定 不 同 查 询 优化 策略 ,例如 针对 字符 
串 匹 配 等 检索 需求 , 通过 Solr 索引 执行 查询 ， 弥 补 
Virtuoso 的 SPARQL 查询 在 模糊 匹配 方面 的 速度 问题 。 
而 针对 SPARQL 语句 COUNT 查询 速度 较 慢 的 问题 ， 
在 数据 批量 导入 后 , 对 STKOS 不 同 元 素 类 型 分 别 进 
行 统计 , 写 入 Solr 索引 中 , 将 COUNT 查询 重 写 为 直 
接 获取 统计 数据 的 查询 操作 。 

为 实现 STKOS 的 广泛 使 用 和 深入 挖 气 , 制定 语 
义 推理 策略 ,一 方面 , 结合 STKOS 的 数据 特点 对 一 些 
常用 的 推理 结果 进行 离线 推理 ,并 进行 物理 存储 或 创 
建 索引 。 例 如 ,针对 层级 关系 ,如 超级 科技 词 表 中 概念 
之 间 的 上 下 位 关系 以 及 本 体 的 子 类 关系 等 在 物理 存储 
中 分 别 以 三 元 组 形式 存储 , 而 STKOS 应 用 过 程 中 往 
往 应 用 这 类 关系 的 传递 性 推理 功能 , 针对 这 类 推理 采 
用 查询 遍历 的 方法 , 将 顶层 概念 或 类 到 当前 概念 或 类 
的 路 径 作为 层级 结构 存储 下 来 , 使 用 时 直接 查询 ， 以 
此 节省 推理 时 间 。 男 一 方面 , 利用 Virtuoso 本 身 的 后 
向 推理 引擎 和 预定 义 的 SPARQL 查询 模板 支持 在 线 推 
理 需 求 。 如 rdfs:subClassOf 、rdfs: subProperty Of、 
owl:sameAs 等 传递 性 关系 以 及 道 关系 推理 功能 。 

3.5 STKOS API 

为 实现 STKOS 基本 元 素 的 访问 , 采用 Java 语言 
开发 STKOS API, 实现 对 于 Virtuoso 的 SPARQL 查询 
以 及 Solr 查询 的 封装 , 根据 数据 处 理 和 应 用 层级 将 
API 分 为 : STKOS 基本 API、STKOS 上 层 API 和 
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STKOS Solr API。 

(1) STKOS 基本 API 
针对 物理 存储 的 STKOS, 根据 各 类 基本 元 素 , 实 
现 基础 数据 的 封装 , 定义 相应 的 基本 接口 。 超 级 科技 
词 表 的 基本 接口 定义 包括 : 获取 术语 的 名 称 、 同 义 词 
ID 、 上 位 术语 ID 、 连 接 概 念 ID 等 ; 获取 规范 概念 的 
释义 、 优 选 术语 ID 、 连 接 范畴 类 ID 等 ; 获取 范畴 类 
的 优选 名 称 、 非 优选 名 称 、 范 畴 号 、 上 位 范畴 类 ID 等 ; 
获取 词 表 的 题名 、 交 替 题 名 、 类 型 等 。 领 域 本 体 的 基 
本 接口 定义 包括 : 获取 类 的 名 称 、 父 类 URI; 获取 数值 
属性 、 对 象 属性 的 名 称 、 定 义 域 、 值 域 列表 、 父 属性 ; 
获取 实例 的 名 称 、 所 属 类 URI 等 。 

(2) STKOS 上 层 API 

在 STKOS 基本 API 的 基础 上 , 提供 获取 STKOS 
详细 信息 的 接口 定义 , 包括 : 获取 术语 的 上 位 术语 名 
称 、 下 位 术语 ID 及 名 称 、 同 义 词 名 称 、 顶 层 术语 、 术 
语 扩展 属性 和 属性 值 、 通 过 推理 获得 的 上 下 位 术语 等 ; 
概念 的 优选 名 称 、 非 优选 名 称 、 范 畴 类 名 称 等 ; 范畴 
类 的 上 位 范畴 类 名 称 、 下 位 范畴 类 ID 及 名 称 等 。 领 域 
本 体 的 上 层 接口 定义 包括 : 获取 类 的 子 类 URI 和 名 
称 、 通 过 推理 获得 的 层级 结构 类 等 ,获取 顶层 类 、 指 
定 层级 类 列表 , 获取 指定 类 的 实例 URI 和 名 称 以 及 通 
过 推理 获得 的 实例 ,获取 实例 指定 属性 的 取 值 等 。 此 
外 ,针对 STKOS 各 类 元 素 的 类 型 查询 字符 串 查询 等 
定义 相应 接口 。 

(3) STKOS Solr APIT 

STKOS Solr API 进一步 实现 STKOS 面向 实际 应 
用 的 查询 需求 ， 如 模糊 匹配 、 相 似 度 排序 等 ， 主 要 包 
括 : 术语 、 概 念 、 范 畴 类 、 类 、 实 例 等 相关 信息 查询 
接口 以 及 离线 信息 查询 接口 等 ,实现 基于 字符 串 的 全 
文 检 索 、 模 糊 匹 配 、STKOS 的 相关 统计 获取 等 功能 。 
3.6 ”开放 查询 和 推理 接口 

开放 查询 和 推理 接口 实现 开放 引擎 系统 的 对 外 服 
务 。STKOS 开放 查询 和 推理 接口 基于 Web 服务 体系 
架构 , 分 别 利 用 基于 SOAP 协议 和 REST 协议 的 Web 
Service 实现 STKOS 引擎 的 功能 封装 上。 在 STKOS 
存储 与 索引 层 、 查 询 与 推理 功能 层 和 核心 STKOS API 
层 之 上 , 通过 接口 管理 器 控制 STKOS API 的 对 外 服务 中。 

通过 对 第 三 方 的 应 用 需求 分 析 , 将 STKOS 对 外 
服务 接口 具体 划分 为 4 大 功能 , 采用 SOAP 协议 实现 : 


HH 


浏览 服务 接口 , 针对 超级 词 表 中 的 范畴 表 和 范畴 类 实 
现 接 口 方法 , 包括 获取 顶层 范畴 类 、 指 定 范畴 类 的 上 
下 位 范畴 类 以 及 范畴 类 的 层级 结构 等 ; 检索 服务 接口 ， 
针对 超级 词 表 中 的 概念 和 术语 、 实 现 底 层 利 用 Solr 索 
引 查询 的 方法 封装 , 包括 获取 上 位 、 下 位 、 相 关 等 不 
属性 的 概念 和 术语 等 ; 关联 推理 服务 接口 ,实现 关 
联 查询 的 接口 , 用 于 发 现 超级 词 表 中 概念 或 术语 之 间 
的 关联 关系 , 包括 指定 术语 的 相关 术语 、 术 语 所 属 范 
畴 类 、 指 定 概念 的 语义 相关 术语 等 ; 通用 服务 接口 , 实 
现 接 口 运行 的 状态 、 版 本 变更 信息 等 以 及 STKOS 超 
级 词 表 的 统计 信息 (范畴 类 、 概 念 、 术 语 等 统计 信息 ) 
等 [1 

通过 对 STKOS 超级 词 表 的 元 数据 规范 进行 分 析 ， 
将 STKOS 接口 具体 划分 为 三 大 类 , 采用 RESTful 协 议 
实现 : 概念 服务 接口 , 与 STKOS 超级 词 表 中 概念 相关 
的 获取 方法 集合 , 包括 浏览 、 检 索 、 关 联 推理 等 ; 范畴 
服务 接口 , 基于 STKOS 超级 词 表 中 范畴 类 .范畴 表 实 
现 的 接口 方法 ; 通用 服务 接口 , 与 SOAP 接口 中 的 通 
用 服务 接口 类 似 , 实现 了 接口 运行 状态 、 统 计 信 息 等 
方法 站。 

此 外 , 借助 底层 Virtuoso 数据 库 自 带 的 工具 实现 
了 STKOS 的 SPARQL 终端 (如 图 2 所 示 ), 用 户 可 以 通 
过 SPARQL 查询 语言 对 STKOS 超级 词 表 和 领域 本 体 
不 同 命名 图 的 RDF 数据 进行 查询 操作 。 


可 


查询 语句 
select dist 


选项 加 严格 执行 空 变量 的 检查 
The an only be sent back to browser not saved on the server, 


图 2 STKOS SPARQL 终端 
4 应 用 效果 


STKOS 开放 引擎 系统 能 有 效 支 持 科技 知识 组 织 
体系 发 布 服务 平台 的 建设 , 并 提供 可 供 外 部 调用 的 
STKOS 开放 查询 和 推理 服务 接口 , 通过 标准 的 接口 协 


Dhttp:// stkos.las.ac.cn/. 
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议 供 第 三 方 系统 使 用 。 
4.1 支持 STKOS 发 布 服务 平台 建设 

目前 ，STKOS 开放 引擎 系 统 已 经 实现 STKOS 初 
始 版 本 数据 的 有 效 存 储 。 在 Virtuoso 数据 库 中 存储 
STKOS 超级 科技 词 表 约 54 万 个 概念 、142 万 个 术语 、 
1 万 个 范畴 类 , 包括 名 称 、 释 义 、 属 性 、 关 系 等 数据 共 
计 约 7 257 万 个 三 元 组 ,以 及 三 个 领域 本 体 中 1 千 多 个 
类 和 1 万 多 个 实例 , 约 15 万 个 三 元 组 。 为 支持 上 层 应 
用 对 底层 数据 的 快速 访问 ,引擎 系统 提供 259 个 接口 ， 
其 统计 情况 如 表 1 所 示 : 

表 1 STKOS API 接 口 统计 情况 


Level 类 型 量 
术语 18 
概念 12 
范畴; 16 
STKOS 基本 API 范畴 类 
范畴 表 8 
来 源 词 表 14 
本 体 元 素 12 
术语 44 
概念 49 
茹 此 2 16 
STKOS 上 层 API 范畴 类 
范畴 表 8 
本 体 元 素 9 
基本 信息 13 
术语 20 
STKOS Solr API 概念 14 
本 体 元 素 6 
合计 15 259 


基于 STKOS 开放 引擎 系统 , 项 目 组 构建 STKOS 
的 发 布 服务 平台 "(如 图 3 所 示 ), 根据 应 用 需求 设计 索 
引 体系 和 系统 架构 ,在 线 提供 STKOS 的 检索 查询 、 浏 
览 导 航 、 展 示 服 务 , 让 用 户 可 以 方便 地 获取 、 查 阅 和 
利用 科技 知识 组 织 体系 。 此外, 该 平台 提供 STKOS 的 
定制 与 下 载 等 功能 ， 以 满足 不 同 机 构 、 不 同 用 户 对 领 
域 知 识 组 织 体系 的 需求 ,最 大 程度 地 共享 和 重用 
STKOS 科技 知识 组 织 体系 成 果 。 

STKOS 发 布 服务 平台 主要 系统 功能 包括 : 

(1) STKOS 检索 功能 : 通过 关键 词 或 ID 检索 
STKOS 超级 科技 词 表 中 术语 和 概念 ; 

(2) STKOS 浏览 功能 : 建立 范畴 表 的 树 形 导航 ， 
实现 概念 的 分 类 浏览 ; 提供 领域 本 体 的 树 形 浏览 ; 
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应 用 认 


(3) STKOS 定制 功能 : 允许 授权 用 户 通过 检索 和 
浏览 功能 选择 STKOS 超级 词 表 的 概念 或 术语 实现 
STKOS 子 集 的 定制 与 下 载 ; 

(4) 统计 功能 : 统计 STKOS 当前 版 本 的 数据 


引 识 组 冯 宫 | £ 
忠 (STK0S) 利 技 知识 组 织 体系 共享 服务 系统 
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， 手动 三 肌 》 

三 最 新 定制 更 多 
上 开发 出 试 [2015-5-5) 

上 定制 下 载 (2015-4-24) 

上 我 的 检 党 (2015-4-24) 


-者 建设 ”是 科技 知识 组 织 体系 ( STKOS ) 建设 的 重要 环 五 , 主 
系 【STKOS ) ”的 有 效 利用 ,以 STKOS 中 的 知识 点 及 知识 关 


， 本 体 个 性 化 定制 (2015-4-24) 


、 知 识 控 理 和 : 等 服务 ， 让 “科技 知识 组 织 体系 ” 
机 构 和 税 居 信息 处 理 领 域 的 科技 创新 发 挥 作用 . 


3 ， STKOS 在 农业 利 拷 广 摘 数 所 性 表 系 统 示范 


图 3 STKOS 发 布 服务 平台 


4.2 ”支持 第 三 方 检索 服务 系统 应 用 

为 支持 第 三 方 系统 利用 STKOS 超级 科技 词 表 ， 
引擎 系统 对 外 提供 基于 SOAP 协议 和 REST 协议 的 开 
放 查 询 与 推理 接口 "， 其 调用 地 址 和 使 用 方式 如 图 4 所 
示 。 基 于 STKOS 开放 引擎 系统 , 项 目 组 以 中 国 科 学 院 
文献 集成 检索 系统 为 依托 , 通过 开放 查询 与 推理 接口 
访问 STKOS 超级 科技 词 表 的 数据 ,搭建 了 基于 
STKOS 的 检索 服务 实验 系统 。 


图 4 开放 查询 和 推理 接口 
该 检索 服务 实验 系统 实现 基于 STKOS 超级 词 表 
的 智能 检索 功能 ,图 5 展示 了 用 户 输入 关键 词 ‘GENE” 
后 , 检索 系统 利用 开放 查询 与 推理 接口 实现 的 检索 效 
果 。 检 索 系 统 利用 SOAP 协议 的 getStandardWord 接口 
检索 关键 词 “GENE” 返 回 STKOS 中 对 应 的 概念 ， 帮 助 
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用 户 实现 规范 术语 的 检索 。 利 用 getConceptNarrower 
List 接口 和 getConceptBroaderList 接口 获取 对 应 概念 
的 上 下 位 概念 ， 为 用 户 推荐 检索 词 的 语义 相关 词汇 ， 
并 提示 这 些 词汇 在 当前 检索 结果 集 的 命中 数 ( 如 图 5 标 
识 1 所 示 )。 其 次 , 通过 getConceptSemanticRelatedList 
接口 获取 概念 的 语义 相关 词汇 ， 如 果 检 索 结 果 文 献 中 
出 现 了 这 些 词 汇 则 将 其 在 结果 列表 中 提示 出 来 (如 图 5 
标识 2 所 示 )。 此 外 , 利用 queryConcept 接口 获取 模糊 
匹配 的 相关 概念 ， 给 出 检索 推荐 , 丰富 原 有 文献 检索 
结果 (如 图 5 标识 3 所 示 )。 
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图 5 检索 结果 页 面 
S 结 语 


STKOS 开放 引擎 系统 的 开发 与 建设 ,是 对 知识 组 
织 体系 存储 与 访问 机 制 的 一 种 研究 与 探索 。 系 统 采用 
先进 的 语义 仓储 、 索 引 、 查 询 、 推 理 、 接 口技 术 , 构 
建 一 个 能 够 有 效 对 外 服务 的 开放 知识 组 织 引 擎 , 支持 
STKOS 发 布 服务 平台 建设 以 及 基于 STKOS 的 检索 应 
用 , 使 得 公众 能 够 查询 和 浏览 STKOS， 同 时 支持 第 三 
方 系统 对 STKOS 的 深度 开发 和 利用 。 在 未 来 的 工作 
中 将 进一步 提高 系统 的 成 熟 度 和 服务 能 力 , 扩展 应 用 
范围 , 使 其 成 为 支持 国内 各 类 信息 机 构 和 科研 机 构 有 
效 利用 STKOS 的 信息 基础 设施 。 
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Abstract: [Objective] This paper aims to realize the sharing and utilization of the Scientific & Technological 
Knowledge Organization System(STKOS). [Context] An effective Storage and access engine System is the prerequisite 
for knowledge organization system to realize its utilization. [Methods] The open engine system for STKOS is designed 
and implemented, which includes the semantic storage and index system, the semantic query and reasoning kernel, 
STKOS APIs for search, browse, association and navigation of STKOS elements, and the open query and reasoning 
interface for external applications. [Results] This engine system ls used for the constructions of the STKOS publishing 
service platform and a third-party retrieval system based on STKOS. [Conclusions] The open STKOS engine system 
can bring convenience for science and technology literature information agencies and researchers to use STKOS. 
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